#AI 視訊
字節家的搖錢樹,阿里騰訊都想搶
科技大廠既眼紅AI視訊的好生意,沉重的算力消耗也讓人望而卻步。AI短劇帶來的極致成本優勢與工業化生產效率,引爆了資本熱情,也讓AI視訊賽道格局重構。4月初,一匹黑馬殺出:視訊生成模型HappyHorse-1.0在第三方測評平台Artificial Analysis登頂,文生視訊Elo得分1333、圖生視訊Elo得分1392,雙雙超越字節跳動Seedance 2.0與快手可靈,成為不容忽視的新變數。4月10日中午,阿里下場“認領”HappyHorse為“ATH事業群”旗下的AI創新事業部自研,API將在4月30日開放。此前,阿里並非視訊生成的核心玩家。但3月16日,阿里新成立以Token 為核心的“ATH事業群”後,提升多模態能力變成了拉高Token效率的抓手——而HappyHorse可視為這場戰略大轉向的重磅成果之一。不只阿里,科技巨頭正在視訊生成賽道集體壓境。憑藉Seedance系列的生成質量與成熟商業化,字節跳動已構築起顯著壁壘。據瞭解,火山引擎面向企業開放的Seedance API介面,有些機構得到的最低年消費門檻高達1000萬元。以高門檻開放API的底氣,來自市場的極度供不應求。《中國企業家》獲悉,在火山引擎近期的招商會上,許多城市與火山引擎和視訊生成業務洽談合作,有城市為此投入了數千萬、上億元資金,將算力支援作為招商引資的重要配套。另一巨頭騰訊也已下場。知情人士向《中國企業家》透露,騰訊挖走了Seedance開發團隊中的數名核心成員,計畫在5月推出混元視訊大模型新版本,與Seedance正面對壘。“5月的視訊模型賽道,將會格外熱鬧。”01 阿里認真了HappyHorse亮相之前,阿里雖有通義萬相視訊模型,但表現始終不溫不火。作為大模型生態的附屬功能,萬相此前在清晰度、運動連貫性、長視訊穩定性等核心指標上,與Seedance、快手可靈等有明顯差距,也未打通專屬商業化場景。這一次,阿里好像認真了。HappyHorse採用150億參數,將文字、視訊、音訊三種模態Token置於同一序列聯合建模,從底層解決了音畫不同步、語氣與表情不匹配等問題。“它的物理模擬更貼近真實環境。”一位測評人士告訴《中國企業家》。另外,HappyHorse原生支援七國語言唇形同步,詞錯誤率顯著降低。同時,它在成本與速度上表現優異:單張H100生成5秒1080p視訊約38秒,DMD-2蒸餾技術將去噪步驟壓縮到了8步。但HappyHorse的短板同樣突出。測評人士表示,在完成複雜動作與多人互動時,HappyHorse易出現肢體錯亂、軌跡不穩。相比於Seedance,HappyHorse更擅長鏡頭呈現,不擅長動作敘事。在應用方面,HappyHorse的API尚未開放,在內測中,其支援的時長僅為5~10秒,場景上限較低,更適合做短影片、廣告、AI漫劇素材,還難以支撐劇情長片。其本地部署也有門檻,需配備H100或A100顯示卡,消費級顯示卡無法運行。阿里突然在視訊模型戰場投入火力,意欲何為?相關人士表示,HappyHorse誕生於淘天未來生活實驗室,或許意味著阿里希望其能與電商場景碰撞融合。阿里擁有完整的商品、商家、交易與廣告生態,但商品視訊一直是中小商家的痛點:場景搭建、拍攝剪輯成本高,白底圖難以展現賣點。而AI視訊可批次生成多版本、多場景、多語言內容,大幅降低了創作門檻。更關鍵的是,阿里的商品詳情、使用者評價、搜尋行為、轉化資料、直播表現等全鏈路資訊,也可反向訓練電商專屬視訊能力,讓HappyHorse成長為懂電商、能帶貨的內容生產引擎。但這條商業閉環要跑通,除了技術攻堅,還必須先解決阿里的算力問題。接近阿里的人士向《中國企業家》透露,目前阿里內部GPU分配非常緊張。“此前,像月之暗面作為阿里雲大客戶,雖然與Qwen存在競爭,還是能獲得比較充足的算力。現在阿里要支援基模研發、電商、雲服務多條戰線,未來要重新考慮GPU的投入產出比了。”而視訊生成是算力消耗大戶,如果HappyHorse逐步開放推廣,算力需求更將指數級增長。這匹黑馬能跑多快、多遠,很大程度上取決於阿里能否破解算力這一核心瓶頸。02 Seedance的好生意被盯上了儘管挑戰重重,各大廠商仍爭相湧入AI視訊賽道,只因這是一門想像空間極強的生意。目前,紅果短劇等平台收一部劇的最高價格約2000元/分鐘,一部常規短劇的時長約120分鐘,價格約24萬元。而市場上AI短劇的外包製作報價已經低至400元一分鐘,甚至有團隊用自動化工具實現了一天800~1000分鐘的漫劇內容產出。巨大的成本優勢和生產效率,讓AI短劇成為資本追逐的熱點。有AI視訊製作公司負責人告訴《中國企業家》,短短半個月,就有好幾家資本來談收購、併購,目前給他們的估值已超5億元,但他們和合夥人都覺得,這個出價還不夠“美麗”。更有地方政府直接找上門來,希望直接獨家買斷公司的AI漫劇自動化生成工具。Agent技術的進展,也正讓一人公司(OPC)大量湧現。幾個擅長高效使用AI工具的員工,便能頂得上過去一個甚至幾個團隊的工作量。各地政府敏銳地捕捉到了這一趨勢,紛紛對AI視訊、AIGC、AI短劇推出算力補貼、內容獎勵、園區集聚等扶植政策,吸引OPC進入。2月27日,武漢東湖高新區發佈“微短劇八條”,對重大產業項目最高支援5000萬元,爆款短劇單部獎勵50萬元。3月10日,上海市徐匯區發佈《“AI+微短劇”產業扶持意見》,對頭部企業最高給予1000萬元發展支援,同時發放最高100萬元算力券、100萬元語料券,並為OPC減免工位費用。3月13日,深圳市施行新版微短劇扶持政策:AIGC微短劇單項目最高資助200萬元。需求的旺盛和政策扶植,讓字節成為最早嘗到甜頭的公司。據《中國企業家》瞭解,雖然火山引擎向大型影視公司、內容製作公司、特定機構等開放的Seedance API介面“白名單”,有些機構被要求“最低消費”1000萬元/年,客戶仍趨之若鶩。接近火山引擎的人士告訴《中國企業家》,地方政府已將算力扶持作為招商引資的重要配套。一些AI短劇公司以“拼盤”接入API,不少算力費用由政府出面解決,以吸引相關公司落地。“有些城市採購了火山3000萬、7000萬,甚至過億的費用,用於內容扶植。當然其產出的內容也將對本地稅收和GDP產生極大拉動,這個帳很好算的。”清晰可見的變現路徑,疊加千億級的市場增量,點燃了巨頭間的競爭熱情。阿里、騰訊紛紛加碼AI視訊賽道,試圖從字節手中分走一杯羹。接近騰訊的相關人士向《中國企業家》透露,混元視訊模型其實早就有了,“只是效果很差”。近期,騰訊痛下決心,“開出高薪,差不多把Seedance開發組整個挖走了”。新款模型大約5月上線,有望和Seedance掰掰手腕,在短時間內實現技術突破。依託騰訊生態,混元新視訊模型還有望深度融入到視訊號的內容生產、分發、商業化全鏈路,放大騰訊的內容生產力與商業變現空間。03 視訊模型的高風險抉擇雖然所有人都看到了AI視訊在短劇、電商、廣告等領域打開的兆級商業潛力,但這條賽道的燒錢速度,也遠超想像。投入矛盾與定價分化,以及擺在巨頭面前的規模化盈利困境,正在考驗著各家的平衡智慧。雖然火山引擎的收入不菲,但其算力成本負擔依然沉重,收入中的絕大部分,都要用來採購GPU和支付電力成本。4月,火山引擎總裁譚待告訴《中國企業家》:“我們去年已經修改了商業計畫,把目標提升了不少。但目前我們還沒有做3年的盈利規劃,暫時沒有這方面的具體安排。”OpenAI關停Sora,更給狂熱的市場潑下一盆冷水。視訊生成的算力消耗,是大模型的上百倍甚至上千倍,即便全球最具財力的科技公司,也難以承受這種無底洞式投入。OpenAI雖宣稱,關停Sora是為了將資源轉向企業智能體、編碼工具與具身智能等方向,但業內普遍認為,成本與付費嚴重倒掛才是核心原因:Sora單條1080p的視訊生成成本約0.5~1美元,而使用者平均付費意願不足0.1美元,根本無法支撐持續營運。更深層的挑戰,還來自於科技大廠技術路線的高風險抉擇。業內人士向《中國企業家》指出:多模態任務過度消耗算力,在Token用量已經暴漲的情況下,廠商有再多算力依舊不夠燒,要把算力留給誰,就成了關鍵問題。由於忌憚視訊的無底洞式算力投入,Google始終不敢大規模開放API,也未推出獨立的視訊生成C端應用。“去年Google的多模態路線備受推崇,但今年便在Agent浪潮下被Anthropic趕超,現在只能說勉強留在牌桌上。大模型的核心技術路線,往往需要提前一兩年佈局,效果卻要滯後顯現。有時候真的像玄學。”行業成本與收入失衡,近期利益和遠期發展,迫使所有玩家重新審視視訊模型的商業模式與定價邏輯,這也直接催生了行業內的定價策略分化。摩根大通曾判斷:頭部領先模型可以維持溢價,追趕者則不得不通過降價搶佔市場份額。Sora停服後,字節率先選擇漲價。4月8日,即夢宣佈:基礎、標準、高級會員的月度積分分別從1080、4000、15000下調至725、2210、6160,積分縮水近六成,相當於變相漲價。相比之下,Google和快手則選擇用降價換市場:Google在3月底放出的Veo 3.1 Lite版本,將720p視訊生成價格壓至0.05美元/秒。可靈緊隨其後,推出會員限時8折優惠,部分圖片生成功能甚至完全免費。定價的兩極分化,本質上是競爭烈度的直接體現。長期來看,平台、API、廣告、電商都只是外層變數,決定勝負的關鍵因素仍然是:強化模型本身的同時,誰能在效果和成本之間找到最佳平衡點,誰能結合自身生態,找到不可替代的落地場景。 (中國企業家雜誌)
新華社18秒視訊,讓美國前高官“焦慮”了
美國國土安全部前代理部長查德·沃爾夫近日在福克斯新聞網發表一篇文章,寫了很長。而這篇長文針對的,竟是一部僅有18秒的AI視訊。這個視訊在一個月前,即3月9日,由新華社在海外社交媒體發佈,被中國駐美大使館等廣泛轉發。視訊題目是《Shield of Americas, or shackles of Americas(“美洲之盾”還是“美洲之籠”)?》,揭示美國發起的“美洲之盾”峰會及倡議,損害拉美國家獨立自主,破壞地區和平穩定。沃爾夫的文章囉囉嗦嗦講了很多,其實就是以下幾點:第一,美國應該警惕中國用AI工具瓦解美國的影響力;第二,中國深化和拉美務實合作,在美國“後院”形成戰略支點,對美國國家安全構成重大威脅;第三,為維護自身地位,美國應普及美式AI工具,加強對華科技交流審查,以遏制中國影響力。一個小影片,竟讓他嚴重焦慮,確實是小題大作了。再看事實。事實是,美國企圖借所謂“美洲之盾”,組建美國主導的地區安全合作機制,為介入拉美國家內政提供便利。很多拉美政要或學者,對此看得很清楚。古巴國家主席迪亞斯-卡內爾說,所謂“美洲之盾”峰會是“帶有新殖民主義性質”的會議。美國辦這個會的目的,就是讓一些拉美國家接受美國的軍事幹涉。巴西總統魯拉最近說,美國就是想“再次殖民我們”。這也是為什麼,美方高調吹噓的這個“具有歷史意義的會”,巴西、墨西哥、哥倫比亞三個拉美地區重要國家的領導人一致缺席。新華社的18秒視訊,揭示的是事實本質。目前,這個視訊在海外社交平台瀏覽量已經超過150萬,有厄瓜多媒體人評論說:“中國媒體對‘美洲之盾’的解讀很準確。”查德·沃爾夫曾在川普首個總統任期擔任美國國土安全部代理部長,現任美國全球戰略諮詢公司副董事長,並在川普陣營核心智庫——美國優先政策研究所主管國土安全、移民與西半球政策研究。但沃爾夫及他這個圈子裡的人發表的涉華文章,完全沒有嚴肅學術研究之風,充斥著“中國就是威脅、中國做啥都錯、要堅定遏制中國”的陳詞濫調。可見,沃爾夫之流以各種藉口鼓吹“中國威脅”論,連18秒的AI視訊也要東拉西扯一通。 (新華網)
全球AI雙榜第一!力壓GoogleVeo與Grok,Vidu Q3「參考生」之王歸來
【新智元導讀】Vidu Q3帶著「全家桶」重磅回歸,視覺、聽覺、場景能力全面進化。AI視訊的生產級交付時代,真的來了。這個月初,Google一紙公告,把Veo 3.1的視訊生成能力,免費開放給了所有Google帳號。可以說,這是AI視訊史上的一個分水嶺——曾經一條10秒視訊要燒掉數美金的「奢侈品」,正在被巨頭硬生生做成「水電煤」。但越是免費、越是普及,一個尷尬的問題就越藏不住:模型可以無限趨近「能用」,可它和「能交付」之間,依然隔著一整條生產線。榜單上的分數、demo裡的炫技、社交媒體上的爆款片段,全都換不來一個劇組、一支廣告團隊、一條電商內容流水線的穩定輸出。熱鬧歸熱鬧,能用歸能用,從來就是兩件事。而當大多數玩家還在卷免費、卷解析度、卷畫面時長時,一個被低估的中國玩家,悄悄把答案擺上了桌。今天,Vidu Q3帶著「參考生」重磅回歸。作為全球公認的「參考生鼻祖」,這一次,它直接把「參考生」揉進一整套全家桶——以Vidu Q3參考生模型為「核心底座」,Vidu SaaS(Vidu Agent、Vidu Claw)與 Vidu MaaS(Vidu AI 開放平台)全面接入。其中Vidu AI開放平台,可0門檻接入、價格僅為行業平均水平的1/3、切鏡自然合理、生成速度快。同時,它還支援提示詞調優、工作流適配及專項培訓服務,即便在高峰時段也能確保穩健輸出。以上三層加在一起,構成了一套完整的、可直接接入真實生產流水線的內容生產系統。至此,Vidu Q3已全面覆蓋文生、圖生、參考生三大領域,完成由單一模型向全場景視訊生成方案的跨越。正如Slogan所言,「為劇而生,萬物可參」,Vidu正在做一件其他玩家還顧不上做的事:把模型能力,焊死在真正的生產流程中。「參考生之王」回歸 直接拍戲了要理解這件事的重要性,先把背景拎清楚。1月30日,Vidu Q3全球首發,在權威評測榜單AA上一騎絕塵,拿下了全球第一的成績。它一舉超越了Grok Imagine、Gen-4.5、GoogleVeo3.1等一眾領先模型。在全球首個參考生榜單,SuperClue榜單上,Vidu Q3斷層登頂,在多圖/單圖參考任務蟬聯雙榜第一。首次亮相,Vidu Q3便主打「為劇而生」,成為全球首個聲畫直出16秒的AI視訊模型。事實上,整個AI視訊行業的競爭焦點,正在悄悄發生一次根本性的位移。視訊大模型,正在從「生成畫面」邁向「生成內容」。比拚的重點也從單點能力,轉向兩件更本質的事——是否具備完整的敘事能力,以及,是否能進入真實場景的生產級交付。這兩件事,才是把AI視訊從「技術demo」推向「內容生產力」的真正分水嶺。Vidu Q3的出世,恰恰被視為整個行業轉變的階段性節點——從最早的「視訊生成」,到Q2的「演技生成」,再到Q3真正具備「劇集生產能力」的敘事單元級躍遷。每一步,Vidu都踩在了行業演化的關節上。而支撐這次躍遷的關鍵變數,正是Vidu一直握在手裡的那張王牌——參考生。在AI視訊走向生產級交付的這條路上,「參考生」的角色正被徹底改寫。它不再只是一個提升畫面一致性的工具能力,而正逐漸演變為一種可復用、可組合的內容生產範式。作為全球「參考生」首創者,名副其實的「參考生之王」,這一次,Q3直接把其從模型層推到了應用層。這種巨變,直接體現在了漫劇、短劇、廣告、影視劇等應用場景中的可用性和交付性。換句話說,Vidu讓AI視訊,真正具備了「劇」的表達能力,為劇而生。萬物可參,為「劇」而生,聲畫同出在視覺、聽覺和場景上, Vidu Q3系統性升級,招招致命。相較於上一代,Q3不再執著於枯燥的「生成質量指標」(FID/FVD)比拚,而是死磕一個核心目標:讓AI生成內容,真正具備「劇」的表達能力。要知道,所謂的「劇集感」,是由無數個符合直覺的微小細節堆砌而成的。Vidu Q3在視覺、聽覺與場景三個關鍵維度上,交出了一份令人「恐怖」的答卷。在視覺方面,Vidu Q3新增六大特效:粒子、流體、動力學、運鏡、轉場、光影,將其深度融入敘事語言,讓生成內容更接近「成片級表達」。五大沉浸式音效:環境、動態、氛圍、擬音、情緒,讓Q3賦予了AI視訊「聽覺上的敘事連續性」。至此,聲音不再是畫面的附屬,而是情緒的載體。最重要的是,Q3場景能力已進化為直接對齊工業流程的「內容單元」,大幅縮減從創意到成片的距離,覆蓋了短劇、漫劇、影視劇、廣告四大場景。在這些領域,Vidu 不僅實現了極速生成與高頻迭代,更通過極高的視覺穩定性,率先解決了AI創作中「角色一致性」的行業難題。這種從點到面的全場景滲透,標誌著Vidu已從技術驗證期跨入深度產業應用期,建立了不可踰越的落地領先優勢。為了驗證其真實戰力,我們拋棄了傳統的「跑分邏輯」,直接把Vidu Q3扔進更接近真實生產的內容場景裡——漫劇的高燃瞬間、短劇的情緒爆點、影視級的災難與懸疑調度,以及廣告的多元創意。高燃漫劇漫劇,是過去兩年AI內容工業化跑得最快的賽道之一。低成本、短周期、可批次生產,這些特性天然契合AI視訊的能力邊界。但也正因為漫劇對「量」的極致追求,它把AI視訊最致命的那塊短板暴露得淋漓盡致——一致性。一部大約60分鐘的漫劇,每分鐘三四十個鏡頭,每段AI生成的素材只有5–10秒。這就意味著,整部劇是由上千段片段硬拚而成。過去,AI模型最大的問題,是每一張圖之間彼此獨立:人物的臉換了一點、服裝紋樣飄了一點、道具位置跳了一幀,觀眾瞬間出戲。創作者在剪輯台前熬夜重抽素材的痛苦,幾乎是整個行業的共同記憶。一個能夠支援批次生產與快速迭代、同時把主角、場景、道具死死鎖住的模型,是漫劇工業化真正的分水嶺。丟給Vidu Q3一張紅圍巾校服少年的立繪,讓它生成一個「熱血少年覺醒變身」的短片。結果令人震撼,狂風的怒吼、電流的尖嘯、大地的碎裂聲在這一秒瘋狂交織、層層遞進,將情緒推向了最頂峰。最關鍵的突破點在於:複雜的特效變化下,男主形象始終如一。再比如,投喂給Q3一張古風女主的角色圖片、一張江南水鄉的場景圖、一套手繪的服化道參考。提示詞唯寫了一句,「@圖1穿著@圖2衣服,在@圖3江南水鄉行走」。可以看到,動漫女主的臉部特徵被死死鎖住,沒有出現任何畫風偏移或五官融化,服裝的紋理與褶皺也隨著行走步伐自然飄動。而且,背景還夾雜著微風、鳥叫聲、腳步聲生動的環境音效。如果說單人變身是基礎操作,那麼複雜的「雙人肢體纏鬥」則是檢驗AI模型能力的試金石。上傳兩個主角的圖片,在這段激烈的對峙戲中,Vidu Q3展現出了令人膽寒的技術統治力。面對拳腳相加、重擊倒地、連續翻滾等大動態物理互動,Vidu Q3將兩位主角的形象死死鎖住,徹底告別了傳統AI常見的「面部融化」與「服飾穿模」。不僅如此,它在音效與情感生成的顆粒度上達到了影院級水準:沉悶的肉搏聲、倒地後紊亂的喘息,甚至刀鋒逼近脖頸時那一聲微小且冰冷的顫音,都與畫面嚴絲合縫。這一段,可以直接剪進漫劇成片裡,幾乎不需要返工。真人短劇如果說漫劇拼的是「量」,那短劇拼的就是「戲」。中國短劇市場一年狂飆到幾百億規模,單集時長被壓到極致,敘事密度卻反向拉滿——每一句台詞、每一次對視、每一個停頓,都必須精準擊中觀眾的情緒點。大幅降低製作成本和周期,是短劇行業對AI視訊最迫切的呼喚;但前提是——AI必須先學會演對白戲,也就是說,短劇的生死線是「對話」。過去AI視訊在多人對話場景上最容易翻車:要麼兩個人同時張嘴像合唱團,要麼口型對不上台詞,要麼切鏡頭的瞬間人就變了。觀眾能容忍畫面糙一點,但對話一崩,戲就徹底散了。且看下面這段極其細膩的古風雙人對角戲,呈現了Vidu Q3令人驚嘆的「影視級演技」。Vidu Q3 不僅將兩人的骨相特徵與複雜的古裝妝造死死鎖住,更完美呈現了男主嘴角輕佻時那抹似有若無的笑意。這種告別了「AI僵硬感」的細膩神態捕捉,讓角色瞬間擁有了鮮活的靈魂。更令人稱絕的是隨後的雙人台詞交鋒,對話時口型的毫釐不差。再比如來一個現代劇,女強人和霸主之間的糾葛,在Vidu Q3的筆下呈現得淋漓盡致。廣告/電商對於廣告或電商而言,用AI的最大訴求可能就是提升效率──不止是素材版本多,創意要快,要快速試錯。素材生產效率,就是速度、就是搶先引爆熱點的優勢。而Vidu Q3不僅提升了素材生成效率,更重要的是人物、風格統一可控,商品不走樣,背景或人物任意選。比如,下列唇蜜的廣告,利用Vidu Q3參考生功能,可快速篩選不同的風格:只需替換參考模特,一鍵生成不同風格、聲情並茂的視訊,真一鍵出片!鏡頭逐漸推進唇部,模特用唇蜜塗抹在嘴唇上,特寫鏡頭展示唇蜜質感。廣告大片效果,多鏡頭展示。最後手持唇膏模特說說:This touch is more than just color.。去掉bgm,保留人聲再舉一個例子,老梗換新貨,更容易在網上爆紅。比如,威爾·史密斯吃義大利面,就是國外的經典梗之一,可謂歷久不衰。在Vidu Q3,用他的表情包+新的商品(比如漢堡),繼續利用參考生就能生成類似場景的梗圖。這效果看起來是真香!影視預演/內容創意影視劇是AI視訊最難啃的一塊骨頭,但也是價值天花板的最高場景。過去,一個劇本從文字到成片,中間要經歷概念設計、分鏡繪製、預演拍攝、特效合成——這背後,動輒是上千萬的預算,是以「月/年」為單位的製作周期。整個行業最渴望的,是一種能把劇本快速可視化、分鏡自動生成、創意驗證前置的能力,讓導演在燒錢之前,就先看到自己腦中的畫面。Vidu Q3沒有選擇繞路,直接正面正剛。它挑了三種最吃功力的片種:科幻、災難、懸疑。給到一段提示詞:根據參考機甲與未來都市場景,生成一段電影級科幻追逐戲。夜色中的賽博朋克城市高樓林立,霓虹燈閃爍,主角駕駛機甲在高架橋與樓宇之間高速穿梭,後方數架敵方飛行器緊追不捨。鏡頭先從城市遠景俯拍,再切入近距離追蹤,機甲急轉、噴射推進、擦過廣告螢幕與樓體邊緣,期間伴隨爆炸火光與碎片飛散。畫面要求有強烈速度感、空間縱深與電影感,參考主體外觀保持穩定,特效密集但清晰。這個生成的難點在於,俯拍切近景、遠景切追蹤、機甲高速運動、爆炸的碎片層次....每一個細節,都考驗著模型對「電影感」的理解。更狠的是音效,直接構成了一個立體聲場,給人一種身臨其境的壓迫感。再來看災難片,考核的是尺度與震撼,這是這類型大片的標準配方。Vidu Q3在生成效果中,處理了多層次的視覺要素:天空、水牆、慌亂的人群、建築物震顫,每一個要素配合著調度營造出一種末日緊迫感。而且,由遠及近的聲壓推進,更成為了這個視訊重頭戲。更令人想不到的是,一段廢棄醫院的長鏡頭,瞬間拉滿了那種脊背發涼的氛圍感。Vidu Q3不僅在空間推進中保持連貫,還在光影忽明忽暗中保留了真實性,角色表演也有一定的張力。音效更是克制到極致,燈管電流雜音、走廊回音、腳步聲、呼吸聲,把緊張感推向頂點。總言之,Vidu Q3在視覺、聽覺與場景三個關鍵維度上,將四大場景的應用推向了新的高光時刻。偉大的技術 最終都將隱形於無形縱觀科技史,任何一項偉大的技術,其最終的宿命都是「隱形」。當電動機剛發明時,人們驚嘆於電流的魔力;但當大工業時代到來時,電動機隱身於工廠的流水線中,人們只看到源源不斷產出的精美商品。今天的AI視訊行業,正在經歷同樣的蛻變。Vidu Q3通過極盡複雜的底層演算法攻堅,通過從Q1到Q3的艱難跋涉,換來的,恰恰是創作者極其簡單的「為劇而生」。它終結了那個需要靠算運氣、抽盲盒才能得到一段好視訊的時代;它把AI視訊從獵奇者的「玩具箱」,搬到了專業創作者的「工作台」上。「萬物可參」,參考的不僅是現實世界的像素,更是人類無盡的想像力。當你在Vidu App中敲下第一行劇本,當Vidu Claw為你自動生成第一組分鏡,當Vidu Q3用它極具張力的音效和電影級的光影,把你腦海中那個原本只敢做夢的龐大宇宙完美呈現時,你會深刻地意識到:不要用做盲盒的邏輯,去奢望大工業時代的轟鳴。AI視訊的「前戲」已經結束,屬於創作者的、由新質生產力驅動的「大航海時代」,在Vidu Q3按下Enter的那一刻,正式拉開了帷幕。在這個充滿無限可能的時代,最好的故事,不再受制於資本的傲慢與工業的繁瑣。 (新智元)
Sora 死了,享年 6個月
曾經封神的 AI 視訊模型 Sora 就這麼沒了。前幾天,OpenAI 官方親自發文告別 Sora:應用關停、API 關停、視訊功能不再接入 ChatGPT。聽聞這一消息,有網友直接把 Elon Musk “墓碑梗圖”搬出來祭奠。評論區更是“人類迷惑行為大賞”:有人艾特創始人 Sam Altman 問“到底在幹嘛”。有人直接開噴“那我們憑什麼信你下一個產品”,還有人直接吐槽“死之前也不開源一下。”還有人很淡定:“沒事,還有別家能用。”老狐還記得,2024 年初 Sora 剛出來的時候,幾乎是“核爆級出圈”,堪稱“工業革命”。那會兒大家還在卷文生圖,它直接把“電影級視訊生成”甩到你臉上。雨水打在玻璃上的折射、人物走路的慣性、鏡頭推進的節奏,那種感覺不是“ AI 在畫圖”,是“ AI 在拍電影”。Sam Altman 一邊發 demo,一邊持續加碼預期。全網一度覺得這玩意兒,遲早要幹掉影視工業一部分。再後來,產品上線,會員專屬,邀請碼炒到飛起。再再後來,Sora 2 發佈,補齊音畫同步、角色對話、分鏡控制,甚至去年 9 月做了獨立 App。到這一步,其實路徑已經很明顯了,它不止想做工具,它是想做“ AI 時代的內容平台”。換句話說,它想成為 AI 版抖音。但問題也恰恰出在這。一開始大家玩得很開心,“把自己丟進電影裡”確實很爽。第一次:臥槽好牛;第二次:再試一個;第三次:……好像也就這樣。然後就沒有然後了。這不是技術問題,是典型的“ demo 型產品”困境,它證明了“能做”,但沒有建立“要一直用”的理由。新鮮感一過,使用者就散,留不住,也養不出習慣。相關資料顯示,Sora APP 的 30 天使用者留存率僅為 1%,60 天留存率直接歸零。與此同時,版權開始紛紛找上門。日本內容機構發函,好萊塢開始緊張。那怕後來 OpenAI 拉來了 迪士尼,給了 IP 授權,開放漫威、皮克斯、星戰這些大殺器,看起來像是“終於要商業化了”。但是劇情出現反轉,到今年 1 月份,Sora 的下載量已暴跌 45%。再往後就更乾脆了:Sora 一關,迪士尼同步撤退,合作終止、投資取消,一起按下暫停鍵。你說這是產品問題嗎?不完全是。真正壓垮它的,其實是更現實的一件事:算力。做視訊太貴了,有測算說,Sora 一天燒的錢在千萬美元等級,一年下來就是幾十億美元的等級。一個使用者生成一段視訊,背後燒掉的資源,夠 ChatGPT 回答幾十次甚至更多問題。為了控製成本,OpenAI 不得不把免費使用者每日生成額度從 30 個削減到 6 個。這樣下來,進一步削弱了普通使用者的使用意願,加速了留存崩塌。同時,Google Gemini、Meta,以及國內的可靈、即夢等競品相繼推出視訊生成功能,使用者分流加速,Sora 的壓力驟增。走到這一步,問題就很直接了,那個賺錢就保留那一個。於是再看 OpenAI 最近的一系列動作,就完全順理成章:整合產品線做“超級應用”,All in 程式設計和生產力,把算力、團隊、資源都往能賺錢的地方集中。甚至有消息稱,為了給下一代模型騰算力,像 Sora 這種高消耗、低回報的業務,優先順序直接被往後排。說白了,這不是“做不出來”,是“沒必要做了”。聽起來冷血,但在 IPO 前,砍掉浪漫、留下現金流,是所有公司的必修課。回頭看,Sora 確實在 AI 視訊領域開了個好頭,只不過如今主角換了。字節跳動 Seedance 2.0 在卷真實世界模擬,水、布料、微表情,全在往“像真人拍的”逼近。快手 Kling 3.0 已經把商業閉環跑通,幾千萬創作者、幾億條視訊,直接悶聲賺大錢。這裡有個很關鍵的差異,Sora 是在“創造一個新場景”,而這些產品,是在“吃已有場景”。中國有短影片、電商、微短劇這套完整生態,模型一出來,立刻就有人用、有人反饋、有人變現。這是一個天然飛輪,而 Sora 當初做獨立App,本質是在從 0 開始搭生態。沒有創作者體系,沒有分發管道,沒有內容土壤。技術再強,也很難跑起來。可見,AI 視訊這件事,已經從“誰模型更強”,變成“誰生態更完整”。AI 行業,也已然從“炫技階段”,進入“算帳階段”。 (科技狐)